AI资讯新闻榜单内容搜索-Llama 3.1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Llama 3.1
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人

Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人

Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人

TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。

来自主题: AI资讯
6340 点击    2024-08-13 17:07
两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋,你猜怎么着——

来自主题: AI资讯
8449 点击    2024-08-11 17:16
小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布

小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布

小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布

Llama 3.1刚发布不久,Llama 4已完全投入训练中。 这几天,小扎在二季度财报会上称,Meta将用Llama 3的十倍计算量,训练下一代多模态Llama 4,预计在2025年发布。

来自主题: AI技术研报
7156 点击    2024-08-05 15:25
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报
8119 点击    2024-08-02 16:07
大模型行业,根本没有什么“真”开源?

大模型行业,根本没有什么“真”开源?

大模型行业,根本没有什么“真”开源?

最近一段时间开源大模型市场非常热闹,先是苹果开源了70亿参数小模型DCLM,然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源,在多项基准测试中Llama 3.1超过了闭源SOTA模型。 不过开源派和闭源派之间的争论并没有停下来的迹象。

来自主题: AI资讯
6451 点击    2024-08-01 11:26
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码

英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码

英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码

适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。

来自主题: AI技术研报
9645 点击    2024-07-29 20:20